home *** CD-ROM | disk | FTP | other *** search
/ ftp.cs.arizona.edu / ftp.cs.arizona.edu.tar / ftp.cs.arizona.edu / icon / newsgrp / group00b.txt / 000165_icon-group-sender_Tue Nov 28 13:38:37 2000.msg < prev    next >
Internet Message Format  |  2001-01-03  |  5KB

  1. Return-Path: <icon-group-sender>
  2. Received: (from root@localhost)
  3.     by baskerville.CS.Arizona.EDU (8.11.1/8.11.1) id eASKbbc12810
  4.     for icon-group-addresses; Tue, 28 Nov 2000 13:37:37 -0700 (MST)
  5. Message-Id: <200011282037.eASKbbc12810@baskerville.CS.Arizona.EDU>
  6. Date: Tue, 28 Nov 2000 14:15:02 -0500
  7. From: "Steve Graham" <Steve_Graham@labcorp.com>
  8. To: <icon-group@cs.arizona.edu>, <jsampson@indexes.u-net.com>,
  9.    <gep2@terabites.com>
  10. Subject: Re: NLP Tools in ICON
  11. Content-Disposition: inline
  12. X-MIME-Autoconverted: from quoted-printable to 8bit by baskerville.CS.Arizona.EDU id eASJD1310434
  13. Errors-To: icon-group-errors@cs.arizona.edu
  14. Status: RO
  15. Content-Length: 4443
  16.  
  17. Gordon,
  18.  
  19.    I have used Icon, but never S*BOL and in Icon I still consider myself a beginner although I've used it off and on for years.  Could you give us some ideas and/or examples of the differences and superiorities of S*BOL over Icon?
  20.  
  21.    Thanks.
  22.  
  23.  
  24. Steve Graham
  25.  
  26. ===
  27.  
  28. >>> <gep2@terabites.com> 11/27/00 10:45PM >>>
  29. > I asked in the Icon group mailing list about the Porter stemming algorithm
  30. but as there was no response I wrote a very rough one of my own. The Porter
  31. stemming algorithm is available on the Web in C, Perl and Java codings. For
  32. my purposes (medical terms) I have not been very impressed with its
  33. performance, at least in my implementation, but I am probably asking it to
  34. do things it was not meant for. 
  35.  
  36. In general, I don't think either SNOBOL4 or Icon are necessarily the languages 
  37. of choice if you have *REALLY* hard-core, full-bore number crunching that you 
  38. have to do.  (If programming time is the bigger issue, then it's possible they 
  39. STILL are).
  40.  
  41. > I have been taking some interest in Snobol. It seems the company making the
  42. SPITBOL implementation can ask a four-figure price for it, a fact which
  43. intrigues me, when the more sophisticated language Icon is free. 
  44.  
  45. True about the SPITBOL pricing, but the four-figure prices are really only if 
  46. you're going to get the mainframe or Unix server versions.  If you're planning 
  47. to use it (like most of us) on a PC running under some flavor of either Windows 
  48. or OS/2, it's priced rather along the lines of other commercial compilers (and 
  49. MUCH less than, say, IBM's PL/1).  The latest price for SPITBOL386 that I've 
  50. seen on the Catspaw Web page (http://www.snobol4.com) is $295.  Which, yeah, 
  51. isn't being given away but OTOH if you really use the product very much (and I 
  52. use it CONSTANTLY) you ought to save enough time on **one** programming project 
  53. (quite possibly even on ONE PROGRAM) to make that cost back, and probably 
  54. several times over.
  55.  
  56. > ...It makes me think that must be where the action is, rather than with Icon. 
  57. However, there is not much going on in the Snobol mailing list either.
  58.  
  59. I think that BOTH lists are largely inhabited by people who are busier "doing" 
  60. than just "talking about doing", and therefore spend much of their time there in 
  61. "lurk mode".  When interesting topics turn up (which does happen from time to 
  62. time) you can get quite an amazing flurry of activity indeed.  :-)
  63.  
  64. Basically this is a tool which just simply WORKS, so there really isn't much 
  65. need to have a place to conduct a continual bitchfest or anything.  
  66.  
  67. My own personal most recent project (and I actually used a combination of 
  68. SPITBOL386 and SNOBOL4+ for it) was developing programs to read and recover data 
  69. and source programs from a seriously garbled 1Gb hard drive... garbled badly 
  70. enough that the partition sector, boot sector, FAT and root directory were 
  71. essentially gone.  I essentially had to write a SNOBOL4+ loadable function to 
  72. retrieve data at the raw sector level (and I wrote that in assembly language... 
  73. something I've done very little of in the last few years!), and a couple of 
  74. SNOBOL4+ programs to read and create binary disk image files (which can then be 
  75. read subsequently without constant and annoying error retry delays), along with 
  76. the ability to merge image files from several passes (since a lot of these read 
  77. errors, curiously, end up being transient).  Next I wrote various SPITBOL 
  78. programs to pattern match within the binary image files to identify sectors 
  79. containing line-oriented text, non-delimited ASCII data (in this case, usually 
  80. FoxPro database sectors), FoxPro database headers, etc, and then within the 
  81. probable database sectors recovered to match data records of various crucial 
  82. types.  (It's fairly rare for me to write programs for clients which crunch for 
  83. literally a day or more solid...).   
  84.  
  85. Although I own copies of both SNOBOL4+ and SPITBOL386 (and Icon too of course, 
  86. although I admit I use S*BOL *far* more than I actually use Icon), and I 
  87. certainly enjoy the exhilarating speed of SPITBOL, I do write even new programs 
  88. using both compilers depending on the job I'm doing.  SNOBOL4+ is still an 
  89. excellent product, and it's freeware.
  90.  
  91. Gordon Peterson
  92. http://personal.terabites.com/ 
  93. Support the Anti-SPAM Amendment!  Join at http://www.cauce.org/ 
  94. 12/19/98: the day the Conservatives demonstrated their scorn for their
  95.    fraudulent sham of representative government.  Voters, remember it!
  96.  
  97.  
  98.